其他
OpenAI 用 26 分钟改变世界!免费版 GPT-4 来了,视频语音交互快进到科幻片
你在对话时可以随时打断
可以根据场景生成多种音调,带有人类般的情绪和情感
直接通过和 AI 视频通话让它在线解答各种问题从测试参数来看,GPT-4o 主要能力上基本和目前最强 OpenAI 的 GPT-4 Turbo 处于一个水平。
在听和说的同时考虑下一步要说什么;
在适当的时刻插入「是的,嗯,嗯」;
预测对方讲话结束的时间,并立即接管;
自然地决定打断对方的谈话,而不会引起反感;
在听和说的同时考虑下一步要说什么;
在适当的时刻插入「是的,嗯,嗯」;
优雅地处理并打断。此前的 AI 语言助手无法很好处理这些问题,在对话的三个阶段每一步都有较大延迟,因此体验不佳。同时会在过程中丢失很多信息,比如无法直接观察语调、多个说话者或背景噪音,也无法输出笑声、歌唱或表达情感。
体验 GPT-4 级别的智能
从模型和网络获取响应
分析数据并创建图表
聊一聊你拍的照片
上传文件以获取摘要、写作或分析帮助
使用 GPTs 和 GPT Store
通过 Memory 构建更加有帮助的体验而当你看完 GPT-4o 下面这些演示,你的感受或许将更加复杂。ChatGPT 版「贾维斯」,人人都有ChatGPT 不光能说,能听,还能看,这已经不是什么新鲜事了,但「船新版本」的 ChatGPT 还是惊艳到我了。睡觉搭子以一个具体的生活场景为例,让 ChatGPT 讲一个关于机器人和爱的睡前故事,它几乎不用太多思考,张口就能说出一个带有情感和戏剧性的睡前故事。甚至它还能以唱歌的形式来讲述故事,简直可以充当用户的睡眠搭子。做题高手
Altman 在此前的采访中表示希望最终开发出一种类似于 AI 电影《Her》中的 AI 助理,而今天 OpenAI 发布的语音助手切实是有走进现实那味了。
之前的 ChatGPT 让我们看到自然用户界面初露端倪:简单性高于一切——复杂性是自然用户界面的敌人。每个交互都应该是不言自明的,不需要说明手册。但今天发布的 GPT-4o 则完全不同,它的几乎无延迟的相应、聪明、有趣、且实用,我们和计算机的交互从未真正体验过这样的自然顺畅。这里面还藏着巨大可能性,当支持更多的个性化功能和与不同终端设备的协同后,意味着我们能够利用手机、电脑、智能眼镜等计算终端做到很多以往无法实现的事情。AI 硬件不会再试积累,当下更令人期待的,就是如果下个月苹果 WWDC 真的官宣与 OpenAI 达成合作,那么 iPhone 的体验提升或许将比近几年任何一次发布会都大。
放弃 Siri,OpenAI 为 iOS 提炼出一个纯粹在设备上运行的小型 GPT-4o,可选择付费升级使用云服务。
原生功能将摄像头或屏幕流输入到模型中。芯片级支持神经音视频编解码器。
与 iOS 系统级操作 API 和智能家居 API 集成。没有人使用 Siri 快捷方式,但是是时候复兴了。这可能会成为一开始就拥有十亿用户的 AI 代理产品。这对智能手机来说,就像特斯拉那样的全尺寸数据飞轮。说到这里,也不得不心疼明天要举办发布会的 Google 一秒。
现场上手 4 款新 iPad 及配件,我们发现了这些细节